(更 学 党 研究 ) 已 灵 历 ， 天 已 发 表 
“ 睡 美 人 "文献 的 重要 特征 、 预 测 线索 与 政策 启示 ” 


杜 建 1， 武 夷 山 “ 
(1. 中 国医 学 科学 院 医 学 信息 研究 所 北京 100005; 2. 中 国 科 学 技术 发 展 战略 研究 院 北京 100038) 


摘要 : 睡 美人 文献 研究 对 于 图 书馆 界 文献 战略 保藏 、 科 技 界 早期 识别 变革 性 研究 与 缩短 重大 
科学 发 现 的 认可 时 滞 具 有 重要 意义 。 通 过 数据 分 析 和 案例 研究 揭示 了 睡 美 人 文献 具有 多 出 自 
跨 学 科研 究 和 综合 性 期 刊 、 多 具有 潜在 技术 与 应 用 属性 、 多 为 高 质量 研究 三 大 特征 。 初 步 凝 
练 出 预测 睡 美人 文献 的 若干 关键 线索 : 一 是 识别 变革 性 研究 并 追踪 其 技术 转化 应 用 状况 , 包 
括 监测 作者 是 否 持续 开展 该 主题 的 研究 , 是 否 从 理论 研究 拓展 到 实践 研究 , 实践 中 是 否 成 功 
等 ; 论文 发 表 之 后 是 否 有 专利 授权 ,论文 是 否 被 专利 引用 等 。 二 是 笔者 提出 的 一 个 用 于 识别 
非 高 被 引 论文 中 睡 美人 文献 的 无 参数 指标 一 一 Becp 指数 ， 能 够 识别 出 那些 正 处 于 “沉睡 - 唤 
醒 ” 萌 芽 期 的 论文 ,特别 是 长 期 沉睡 后 初 现 被 引 突 增 苗 头 , 且 总 被 引 次 数 尚 未 成 规模 的 论文 。 
基于 睡 美 人 文献 重要 特征 与 预测 线索 的 分 析 ， 从 加 强 变革 性 研究 、 识 别 研究 前 沿 和 改善 学 术 
评价 三 个 方面 讨论 了 睡 美 人 文献 研究 的 政策 启示 。 
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Abstract: The study on systematic identification of “Sleeping Beauty” (SB) publications and on 
their awaking mechanisms will promote the strategic preservation of documents in libraries, and 
provide implications for identifying potential “ahead of time” discoveries or transformative 
research, and shortening time lag for original research to get recognized. Based on the data 
analysis and case studies, this paper figured out some key characteristics of SB publications. The 
content of SB papers tends to be multi-discipline research and most of which tend to be published 
in prestigious multidisciplinary journals with higher Impact and wider scope. One is perhaps more 
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inclined to believe that SB relate to more fundamental and basic, and less to application-oriented 
work. But a surprising finding is that half of the SBs are application oriented and significantly 
more cited in patents than “normal”papers，which demonstrated the potential technical and 
application-research properties of SB. The key publications and pioneering works of the recent 
Nobel Prize winners for physiology and medicine are delayed-cited rather early-cited in the entire 
citation life-time of an article. We further suggested several clues for early identifying SB. First， 
Transformative research tend to be neglected or resisted by the scientific community initially and 
this neglect or resistance could be regarded as the key clue for the early prediction of SB literature. 
Publications belonging to so-called transformative research, even when less frequently cited than 
others, should be given special attention as early as possible, because they may suddenly attract 
many citations after a period of sleep. One could identify transformative research through some 
text terms (such as "disagree", "overcome", "break", "dispute"...). In order to discern such 
potential transformative research, we could observe whether the relevant documents get early 
citation from patents or not, because many SB documents tend to be technical research in nature 
and application-oriented. Second, the Bcp index proposed in our foregoing paper ls more sensitive 
in identifying the “lower level SBs’”, which refers to the case when the total citations and the 
maximum annual citations of SBs are not so high in comparison with other typical SBs. This 
index may be used to identify the papers at the sleeping-awakening interface, which provided new 
tools for arousing attention of the science community to previously overlooked but important 
research. We also pondered some policy implications about the associations of SB publications 
with transformative research, research front and research evaluation. 
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“ 睡 美人 ”(Sleeping Beauties) 文献 是 指 一 篇 文献 在 发 表 后 的 相当 长 一 段 时 期 内 零 被 引 
或 低 被 引 ， 仿 佛 在 沉睡 ， 而 后 突然 高 被 引 ， 就 像 被 唤醒 一 样 。 唤 醒 睡 美人 的 文献 被 称 为 王子 
文献 山 。 睡 美人 文献 通过 动态 反映 文献 被 引 的 时 序 特征 和 历史 过 程 ， 从 科学 计量 学 角度 对 科 
学 社会 学 领域 延迟 承认 现象 作 了 定量 描述 。 科 学 和 技术 领域 都 有 延迟 承认 现象 , 在 科学 中 表 
现 为 睡 美 人 文献 , 在 技术 中 表现 为 睡眠 专利 (sleeping patents ) 口 。 文 献 引用 符合 “长 尾 分 布 ”， 

睡 美 人 文献 本 身 是 高 被 引文 献 ， 本 研究 既 考虑 了 “ 头 部 ”( 高 被 引 )， 也 考虑 了 “长 尾 ”(〈 低 被 
引 和 和 零 被 引 )。 针 对 睡 美人 文献 被 引 生命 周期 全 谱 段 的 研究 是 对 引文 分 析 的 深化 ， 可 以 从 新 
的 角度 反映 论文 的 质量 与 影响 。 

从 截至 目前 有 关 睡 美人 文献 的 大 规模 的 分 析 来 看 , 在 严格 的 人 为 参数 界定 下 , 睡 美人 文 
献 的 比例 约 为 万 分 之 一 到 二分 之 一 ， 而 对 于 诺 贝 尔 奖 得 主 发 表 论文 , 睡 美人 文献 的 比例 约 为 
百 分 之 一 。 笔 者 认为 睡 美 人 文献 并 非 以 往 所 认为 是 罕见 的 , 情报 学 和 科学 计量 学 领域 对 高 被 
引文 献 的 界定 也 通常 选取 被 引 次 数 排名 前 1%、 前 1%o 的 文献 ， 而 睡 美 人 文献 也 是 这 样 的 比 
例 。 如 何 能 早期 预测 睡 美 人 文献 ， 找 到 睡 美 人 文献 的 早期 标志 ， 提 示 图 书馆 界 长 期 收藏 ， 提 
示 科 学 界 及 早 关注 ， 对 于 促进 科学 家 洪 心 创新 、 规 避 延 迟 承 认 将 具有 重要 意义 ,在 实践 中 对 
于 基金 资助 机 构 和 科技 决策 者 发 现 超前 性 或 变革 性 创新 , 提前 部 署 相 关 的 前 沿 研 究 和 科技 规 
划 也 将 有 重要 参考 价值 。 

本 文通 过 案例 研究 和 数据 分 析 总 结 睡 美 人 文献 的 重要 特征 , 试图 能 找到 睡 美 人 文献 的 大 
F 预 测 线 索 ， 并 由 此 讨论 睡 美人 文献 研究 的 科技 政策 启示 。 这 样 ， 在 潜在 睡 美人 文献 被 引 次 
数 很 少时 就 能 够 及 时 发 现 其 睡 美人 潜质 并 推荐 给 学 术 共 同体 , 以 缩短 重要 科学 发 现 的 认可 时 
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1 睡 美人 文献 的 重要 特征 研究 
根据 直观 理解 ， 人 们 往往 认为 睡 美 人 文献 多 倾向 基础 性 、 前 沿 性 和 理论 性 的 文献 ， 提 出 
的 高 深 理论 或 概念 超前 于 当时 条 件 与 认 知 水 平 , 因此 不 被 理解 而 遭遇 延迟 承认 。 因 而 睡 美人 
文献 似乎 应 该 多 为 基础 研究 而 非 应 用 研究 ,似乎 应 多 具有 科学 属性 而 非 技 术 属 性 。 但 科学 和 
技术 是 相互 依存 、 相 互 促进 的 。 科 学 研究 是 追求 真理 和 知识 创新 的 活动 ， 并 以 其 研究 成 果 提 
升 社会 实践 为 目的 。 任 何 科学 研究 都 需要 真正 的 施 惠 人 类 社会 才 是 其 最 终 价值 的 体现 中 。 笔 
者 假设 , 既然 睡 美人 文献 总 是 与 重大 科学 发 现 相关 联 , 而 这 样 的 科学 发 现 之 所 以 重要 是 因为 
它 必 定 具 有 实践 的 属性 。 因 此 ， 睡 美人 文献 是 否 也 应 该 具有 技术 与 应 用 属性 ,而 非 纯 科学 属 
性 ? 本文 将 在 现 有 相关 研究 基础 上 ， 继 续 通 过 典型 案例 和 小 规模 数据 来 验证 这 一 假设 。 
1.1 多 出 自 跨 学 科研 究 和 综合 性 期 刊 
Ke et al. (2015) 做 了 至 今 最 大 规模 的 睡 美人 文献 研究 , 对 1900s 以 来 Web of Science 收录 
的 被 引 次 数 至 少 为 1 次 的 2200 多 万 份 发 表 在 自然 科学 及 社会 科学 领域 的 论文 进行 系统 分 析 
后 发 现 外 ， 物 理学、 化 学 和 数学 贡献 了 最 多 的 睡 美人 文献 ， 睡 美人 文献 的 研究 内 容 多 具有 
_ 科 交 叉 的 特征 。 产 出 睡 美 人 文献 最 多 期 刊 是 《自然 》《 科 学 》 和 《美国 科学 院 院 刊 》 均 为 
~ 合 性 期 刊 。 原 因 在 于 综合 性 期 刊 的 多 学 科 交 融 性 ， 因 此 能 在 几 十 年 后 还 受到 持续 的 关注 ， 
. 到 某 年 在 机 缘 巧 合 之 下 浮 出 水 面 ,在 这 三 种 杂志 上 发 表 的 高 水 平 论文 可 能 是 过 于 超前 的 思 
无 法 被 当时 的 学 术 界 理解 ， 或 是 偏向 未 来 主义 的 大 胆 预 测 ， 直 到 预言 证 实 之 日 才 得 以 苏醒 。 
1.2 具有 潜在 技术 与 应 用 属性 
1.2.1 多 为 应 用 导向 型 研究 且 常 被 专利 引用 
数据 量 位 于 第 二 的 睡 美人 文献 研究 是 van Raan(2015) 从 Web of Science 数据 库 1980-1994 
年 发 表 的 论文 中 (被 引 次 数 统计 截至 2013 年 ， 被 引 至 少 20 年 )， 按 照 一 个 比较 严格 的 阔 值 
一 一 [10, 1, 10, 5]， 即 发 表 之 后 10 年 内 年 均 被 引 次 数 不 超过 1 次 ， 唤 醒 后 10 年 后 年 均 被 引 
次 数 要 大 于 5 次 ,来 识别 物理 学 、 化 学 、 工 程 学 与 计算 机 科学 领域 的 睡 美人 文献 。 认 为 睡 美 
人 文献 多 是 应 用 型 (技术 ) 创新 。 
按 上 述 标 准 ， 共 识别 出 物理 学 领域 睡 美人 文献 389 篇 ， 化 学 领域 265 篇 ,工程 与 计算 机 
领域 367 篇 。 物 理学 领域 睡 美人 文献 中 有 210 篇 〈 占 53%) 被 划分 到 至 少 一 个 应 用 型 研究 
领域 , 即 超过 一 半 的 睡 美人 文献 有 具有 应 用 研究 型 倾向 。 基于 荷兰 莱 顿 大 学 提出 的 期 刊 分 类 系 
统 ， 将 期 刊 分 为 基础 研究 和 应 用 研究 ， 对 这 些 睡 美人 文献 的 发 表 期 刊 分 析 发 现 , 物理 学 领域 
睡 美人 文献 ， 有 约 一 半 发 表 在 应 用 型 研究 期 刊 上 ， 化 学 领域 睡 美人 文献 中 ，70% 发 表 在 应 用 
型 研究 期 刊 上 ; 在 工程 和 计算 机 领域 , 全 部 论文 均 发 表 在 应 用 型 期 刊 上 。 可 见 ， 物 理学 、 化 
学 、 工 程 学 和 计算 机 科学 领域 的 睡 美人 文献 多 为 应 用 导向 型 研究 站。Van Raan 将 其 称 为 潜在 
的 睡 美人 创新 (Sleeping Innovations )。 采 用 PATSTAT 数据 库 检 索 这 些 文献 是 否 被 专利 引用 
过 外， 发 现 3 个 学 科 领 域 睡 美人 文献 被 专利 引用 的 比例 (16%，23%，29%) 远 高 于 所 有 文 
献 的 平均 水 平 ， 在 Web of Science 数据 库 中 ， 大 约 4% 的 文献 会 被 专利 引用 。 可 见 睡 美人 文 
献 被 专利 引用 的 次 数 要 比 “普通 ”论文 被 专利 引用 的 次 数 更 多 , 即 睡 美人 文献 更 易 被 专利 引用 。 
受 van Raan 以 上 研究 的 启发 ， 笔 者 继续 探讨 ， 既 然 睡 美人 文献 有 具有 潜在 的 技术 与 应 月 
属性 , 那么 睡 美人 文献 在 发 表 之 初 的 低 被 引 或 零 被 引 阶段 是 否 会 被 专利 引用 ? 被 专利 施 引 自 
是 否 早 于 唤醒 年 ? 
1.2.2 被 专利 首次 引用 年 常 早 于 唤醒 年 
(1) 2014 年 诺 贝尔 化 学 奖 关键 论文 被 专利 引用 情况 
笔者 前 期 相关 工作 已 发 现 四 ，2014 年 诺 贝尔 化 学 奖 关键 论文 一 Hell SW 于 1994 年 发 
表 于 Optical Letter 的 论文 是 一 篇 典型 的 睡 美人 文献 ， 简 称 Hell(1994)。 基 于 Lens.org 专利 - 
论文 引用 检索 平台 ， 截 至 2017 年 2 月 14 日 ，Hell(1994) 这 篇 文献 共 被 67 项 专利 、50 个 专 
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利 族 所 引用 , 其 中 首 项 施 引 的 专利 就 是 Hell Stefan 和 Wichmann Jan 于 1995 年 2 月 1 日 向 世 
界 知 识 产 权 组 织 申 请 的 PCT 专利 , 名 称 为 Process and device for optically measuring a point on 
a sample with high local resolution，1995 年 8 月 10 日 公开 。 专 利 发 明 人 和 论文 的 作者 完全 相 
同 。 该 专利 于 1994 年 2 月 1 日 最 早 申请 了 德国 专利 。 同 时 于 1996 年 11 月 21 日 向 美国 专利 
局 申请 ， 并 于 1998 年 3 月 24 日 获得 美国 授权 (US 5731588)。1997 年 10 月 22 日 申请 了 欧 
盟 专利 ， 并 于 2001 年 8 月 8 日 获得 欧盟 授权 。 


Nature 上 的 Top10 睡 
Lens.org 检索 论文 被 专利 引 
与 专利 引 月 

(publication hy 表 1 可 见 ，10 篇 睡 美人 文献 中 ，6 篇 
数 最 多 的 是 第 ， 受 到 49 个 专利 族 的 引 月 
FE) 减 去 论文 发 表 年 ， 
下 的 唤醒 年 。 
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图 1 2014 年 诺 贝 尔 化 学 奖 关键 论文 


这 项 专利 仅 引用 了 2 篇 非 专利 文献 ”1， 


笔者 前 期 提 昌 


的 链接 。 


属 性 。 


美人 文献 [ 


Hell(1994) 被 专利 引用 情况 


而 这 两 篇 文献 恰好 就 是 获得 诺 贝 尔 奖 的 2 篇 关 


试图 探索 一 下 这 些 睡 
的 情况 ，PubMed 数据 库 已 
基于 同族 专利 统计 被 引 次 数 ,首次 施 引 专 利 界定 为 首 项 授权 专利 
其 中 被 专利 引用 次 
目 。 专利 被 引 时 滞 是 指 专利 优先 权 年 〈 最 早 申请 
以 上 的 案例 分 析 表 明 ， 睡 美人 文献 被 专利 施 引 的 年 份 均 早 于 论文 引用 


键 文献 ， 这 两 篇 文献 同时 又 是 睡 美 人 文献 ， 其 唤醒 时 间 是 2000 年 中 

始 就 具有 科学 -技术 双重 
(2) Science 和 Nature 睡 美人 文献 被 专利 引用 情况 

是 出 了 一 个 识别 睡 美人 文献 的 新 的 无 参数 指标 ，3 


用 该 指标 评 
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美人 文献 是 否 被 专利 
中 PubMed 论文 


被 专利 引用 过 


日 过 。 


引用 过 。 


表 1 Science 和 Nature 上 10 篇 睡 美人 文献 被 专利 引用 的 情况 


。 可 见 ， 该 研究 从 一 开 
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Science, 1970, 
255 |2002 
170(3957), P497 
Nature, 1973, Oct 7, | Sep 27, GB 
415 |2005 6 Sep 26, 1983 | 8 9 
244(5414), P281 1986 1982 8227500 


被 引 次 | 唤醒 | 专利 族 被 | 首次 施 引 专利 | 专利 | ，， 被 引 
期 刊 来 源 i ,ww | 授权 年 优先 权 年 | 优先 权 号 | 
数 | 年 | 引 次 数 | 申请 年 ”| 族 数 | 时 湾 
Science, 1971, 
553 2002 - 
171(3977), P1212 
Nature, 1970, Oct 10, | Sep 10, US 
602 |2003 31 May 3, 2002 1 28 
227(5258), P561 2006 1998 9976398 
Nature, 1970, Oct 20, | Jul 17, US 
241 2005 2 Sep 30, 1994 2 16 
225(5232), P563 1998 1986 88707086 
Science, 1972, 
888 |2002 - 
177(4047), P393 
Nature, 1970, 
736 | 2003 - 
227(5257), P520 
Nature, 1971, Jan 20, | Sep 27, US 
280 1999 1 Sep 27, 2001 1 29 
229(5286), P560 2004 2000 23604500 
Science, 1970, Sep 4, | Dec 27, US 
423 2004 6 Dec 27, 1988 | 15 18 
167(3916), P279 1990 1988 29030788 
注 : 专利 被 引 次 数 截至 2017 年 2 月 14 日 ， 数 据 来 源 : lens.org 


1.3 高 质量 研究 往往 表现 出 延迟 承认 特征 


上 文 探讨 了 睡 美人 文献 的 技术 与 应 月 
睡 美 人 文献 与 学 术 质 量 之 间 的 相关 性 。 


1.3.1 学 术 质 量 与 学 术 影响 之 差异 的 相关 研究 


学 术 质量 和 学 术 影响 之 间 的 相关 性 


[三 | 


EE 


山 | 


与 学 术 质 量 的 相关 研究 主要 


属性 , 特别 是 与 专利 引 


] 的 相关 性 , 接 下 来 再 探讨 


完 或 两 者 之 间 差 异 之 下 
题 。 目 前 ， 以 诺 贝尔 奖 论文 作为 高 


2002-2005 年 诺 贝 尔 生 理学 或 医学 奖 、 化 学 奖 、 物 至 
数 。 代 表 性 论文 通过 2 种 方式 确定 :人 
述 ， 人 @O) 诺 奖 委员 会 在 当年 的 诺 奖 发 
的 许多 重要 突破 性 工作 在 被 引 频 次 方面 表现 一 般 或 低 引 用 
叶 认 采用 20 世纪 Nature 上 发 表 的 21 项 被 认为 改变 了 科学 和 世界 的 重要 发 现 患 ] 
是 最 高 被 引 论文 ， 但 都 高 于 学 科 平 均 被 引 0。 
H 线 多 数 不 规 则 ， 而 
51。 根据 上 述 启发 ， 笔 者 仍 以 诺 贝尔 奖 关键 论文 为 对 象 ， 对 其 被 引 延迟 程 


描 


品 
90 


质 论 文 不 
究 发 现 , 高 质量 论文 的 被 引出 


相关 研究 。 

芷 为 高 质量 论文 代表 ， 发 现 高 
江 和 叶 鹰 继而 采用 对 照看 

昌 线 多 数 很 规则 

度 或 睡 美 人 文献 特征 进行 测度 条 


中 


究 。 考 虑 到 最 近 10~20 重 


究 一 直 是 科学 计量 学 与 科 
质量 论文 代表 探讨 被 引 次 数 


两 项 : 一 是 美国 Eagle 分 子 医 学 
学 奖 、 经 济 学 奖 的 代表 性 论文 的 被 引 次 
诺 奖 得 主 本 人 在 诺 奖 颁奖 1 


究 所 的 Shi V Liu 统计 了 


礼 或 个 人 简历 上 的 权威 


新闻 稿 上 提供 的 信息 。 太 


12] 


究 指 出 包括 诺 贝 尔 奖 在 内 
二 是 我 国学 者 叶 座 和 李江 的 


本 
高 影响 论文 的 被 引 


FE 科学 技术 的 发 展 速度 、 学 术 共 同 


1.3.2 诺 奖 关键 论文 是 否 遭 遇 延 迟 承 认 ? 


(1) 资料 与 方法 


为 了 寻找 获得 话 奖 的 关键 文献 (key Publications )， 笔 者 系统 下 
Chttp:/www.nobelprize.org/) 的 相关 信息 09， 发 ] 
学 或 医学 奖 获 奖 的 代表 作 ， 在 Press Release 或 Scientific Background 中 以 加 
其 他 领域 各 年 获奖 均 未 给 出 代表 作 。 获 取 到 


门 注 明 的 


计 被 引 次 数 ， 截 至 2016 年 11 


BS 式 给 出 。 除 2014 年 
2009-2016 年 度 授予 的 诺 贝尔 生 型 


体 和 科技 论文 总 量规 模 的 膨胀 ， 选 取 最 近 授 予 的 诺 贝 尔 奖 及 其 


的 化 学 奖 以 外 ， 


现 2009-2016 年 的 诺 奖 


关键 论文 为 对 象 展开 分 析 。 


究 了 诺 奖 官网 
官网 专门 标注 了 生理 
粗 、 加 星 号 或 专 


学 或 医学 奖 的 关键 论文 共计 33 篇 , 通过 Web of Science 统 


ij 18 日 。 


笔者 引入 Wang(2013) 提 出 的 被 引 速 率 (Citation Speed, CS) 指标 ， 即 整体 上 一 篇 论文 


自发 表 后 以 多 快 的 速度 累积 它 的 被 引 次 数 [ 1]。 


对 于 快速 突破 型 


论文 ， 被 引 次 数 会 在 发 表 后 


迅速 累积 ， 到 达 一 个 较 高 的 水 平 ， 接 下 来 维持 稳定 ， 整 体 上 的 被 引 速 率 很 快 (高 )。 但 对 于 
延迟 承认 型 〈 睡 美人 ) 文献 ， 发 表 之 初 的 被 引 次 数 累积 得 很 少 、 很 慢 ， 直 到 最 后 几 年 才 累 积 


完 , 所 以 整体 上 的 被 引 速 率 较 低 。 如 果 一 篇 论文 以 恒 


Citation Delay=1 — Citat 


定 的 速率 累积 


ion Speed 


D 反映 了 论文 的 被 引 延 迟 程度 ，D 值 越 大 ， 说 


一 是 截至 本 研究 的 时 间 ; 二 是 截至 获得 诺 贝 奖 的 时 间 。 


(2) 三 分 之 二 的 论文 遭遇 延迟 承认 


其 被 引 次 数 ， 说 明 每 各 
被 引 次 数 相 同 。Wang, Thijs& Glinzel (2015) 提 出 了 被 引 速 率 的 反 向 指标 
简称 D。 笔 者 将 其 翻译 为 被 引 延迟 指数 08， 其 定义 是 : 


明 论 文 被 引 的 延迟 程度 越 大 。 我 们 采用 
D 指标 反映 在 观察 期 内 论文 总 被 引 次 数 累 积 的 快慢 。 被 引 延 迟 指数 大 于 0.5， 说 明 整 体 上 被 
引 次 数 延 迟 ， 小 于 0.5 说 明 整 体 上 论文 被 引 次 数 是 在 前 半 段 累积 起 来 的 。 设 置 两 个 观察 期 ， 


FE 的 


Citation Delay, 


33 篇 诺 奖 关键 论文 信息 见 下 表 ，Nature、Cell 和 Science 仍 是 发 表 诺 奖 成 果 论 文 的 主要 
期 刊 ， 分 别 发 表 9 篇 、6 篇 和 3 篇 ， 占 54.5%， 即 超过 一 半 的 医学 领域 诺 奖 关 键 论文 发 表 在 


这 三 大 权威 期 刊 上 。33 篇 论文 ， 最 早 发 表 于 1962 年 ， 最 近 发 表 于 2006 年 。 
表 2 2009-2016 年 授予 的 诺 贝 尔 生 理学 或 医学 奖 的 33 篇 关键 论文 
获奖 序 被 引 
获奖 者 期 刊 发 表 年 D1 D2 
年 号 次 数 
1 Journal of cell biology | 564 1992 0.590 0.590 
Yoshinori 
2016 2 Febs letters 733 1993 0.663 0.663 
Ohsumi 
3 Nature 733 1998 0.607 0.607 
4 Nature 819 2000 0.620 0.620 
i Antimicrobial agents 
Satoshi Omura Ss 588 1979 0.535 0.988 
pp and chemotherapy 
William C. Antimicrobial agents 
6 302 1979 0.382 0.987 
Campbell and chemotherapy 
Youyou Tu . Yao xue xue bao 14 1981 0.761 0.995 
8 Brain research 2150 | 1971 0.781 0.781 
John O'Keefe - 
Experimental 
9 747 1976 0.647 0.638 
2014 neurology 
May-Britt 10 | Science 495 2004 0.582 0.603 
Moser and 11 Nature 1074 | 2005 0.632 0.644 
EdvardI. Moser | 12 | Science 466 2006 0.598 0.613 
James E. 
13 | Cell 562 1984 0.393 0.416 
Rothman 
Randy W. 14 | PNAS 364 1979 0.508 0.522 
2013 | Schekman 15 | Cell 549 1990 0.367 0.387 
Thomas C. 16 | Nature 638 1990 0.385 0.410 
Siidhof 17 | Nature 2331 | 1993 0.371 0.387 
18 | Nature 514 1993 0.421 0.443 
Sir Jobn B. Journal of embryology 
19 | and experimental 435 1962 0.732 0.649 
Gurdon 
2012 morphology 
Shinya 
20 | Cell 9271 | 2006 0.634 0.720 
Yamanaka 
Bruce A. 
21 Science 4964 | 1998 0.506 0.552 
Beutler 
Jules A. 
22 | Cell 2136 | 1996 0.557 0.595 
2011 Hoffmann 
Journal of 
Ralph M. 23 . .. 1320 | 1973 0.647 0.612 
. experimental medicine 
Steinman 
24 | PNAS 624 1978 0.423 0.408 


Journal of 
2 . 本 948 1985 0.407 0.450 
experimental medicine 
26 Lancet 200 1965 0.558 0.537 
27 | Nature 277 1969 0.457 0.424 
Robert G. 
2010 28 | Nature 128 1970 0.385 0.338 
Edwards 
29 | Lancet 905 1978 0.674 0.651 
30 | Nature medicine 14 2001 0.681 0.889 
Jack W. 
Szostak; 
人, 31 Cell 391 1982 0.378 0.332 
Elizabeth H. 
Blackburn 
Carol W. 
2009 Greider; 
. 32 | Cell 1960 | 1985 0.622 0.645 
Elizabeth H. 
Blackburn 
Carol W. 
Greider; 
. 33 | Nature 1062 | 1989 0.501 0.519 
Elizabeth H. 
Blackburn 
注 : D1 是 指 从 论文 发 表 年 到 被 引 次 数 统计 年 的 被 引 延 迟 指数 ，D2 是 指 从 论文 发 表 年 到 获奖 年 的 被 引 延迟 指数 。 
对 33 篇 文献 的 被 引 延迟 程度 测度 结果 表明 ,无 论 是 被 引 次 数 的 统计 时 间 界 定 为 至 获奖 年 


还 是 至 2016 年 ， 三 分 之 二 的 文献 (22 篇 ) 的 被 引 延迟 指数 均 大 于 0.5， 说 明 从 长 期 来 看 ， 
这 些 文献 都 遭遇 了 一 定 程度 的 延迟 承认 ， 这 对 延长 科研 评价 周期 有 重要 启示 。 


2 二 全 天 和 划 自 是 
Citation Delay (发表 年 至 裴 丈 秆 } citation Delay〔 发 表 年 至 2016 年 ) 
1 雪人 当今 a 
全 + 
全 
ba 种 
0 S * 
9 + 
$989 $i ors a 
voorrters Ye 他 要 “多 
人 ba 
DD a 当中 亿 os 居 二 ”过 和 和 
A $9 4 
4 +*4 4 
人 人 1 sre ee 7+ 
轴 信 
i 0 0 


2 2009-2016 年 授予 的 诺 贝 尔 生理 学 或 医学 奖 的 33 篇 关键 论文 的 被 引 延迟 指数 


上 文 归纳 了 睡 美人 文献 的 3 个 重要 特征 , 跨 学 科 性 , 技术 与 应 用 属性 , 多 为 高 质量 下 
基于 上 述 研 究 ， 笔 者 试图 凝练 出 预测 睡 美 人 文献 的 一 些 关键 线索 和 思路 。 


异 


C= 


2 睡 美人 文献 的 预测 线索 

睡 美人 文献 的 预测 属于 科技 预测 的 范畴 ,任何 预测 都 很 困难 。 对 于 睡 美人 文献 ， 要 想 检 
验 预测 是 否 准 确 ， 还 需要 长 期 的 观察 , 需要 时 间 因 素 。 本 文 并 未 直接 提出 睡 美人 文献 的 预测 
方法 或 综合 模型 ， 而 是 通过 基础 性 研究 , 希望 能 为 预测 睡 美人 文献 提供 一 些 关 键 的 线索 或 思 


路 。 主 要 体现 在 两 个 方面 : 
2.1 识别 变革 性 研究 并 追踪 其 技术 转化 应 用 状况 
识别 变革 性 研究 并 追踪 研究 转化 或 被 专利 引用 情况 可 作为 预测 睡 美 人 文献 的 重要 线索 。 


无 论 是 通过 典型 睡 美 人 文献 案例 的 回顾 性 研究 , 还 是 笔者 前 期 基于 专家 评议 信息 追踪 论文 被 
引 次 数 状况 的 前 瞻 性 研究 ”都 提示 ， 睡 美人 文献 反映 的 创新 成 果 多 是 变革 性 研究 ， 实 际 上 ， 
变革 性 研究 是 睡 美 人 文献 这 一 现象 的 本 质 。 从 Hell(1994) 案 例 来 看 ， 预 测 睡 美人 文献 ， 要 特 
别 关 注 变革 性 研究 ， 特 别 是 那些 提出 可 以 打破 某 一 领域 经 典范 式 的 新 方法 或 新 观点 的 文献 
一 一 在 标题 或 摘要 中 常 出 现 “break/overcome...limits”、“Ppossible”、“potential”* 等 术语 。 对 于 


这 类 文献 的 作者 ， 要 注意 追踪 检索 其 后 续 发 表 的 文献 ， 如 果 发 现 他 /她 仍然 在 坚持 该 领域 的 
研究 , 而 且 一 段 时 间 之 后 能 够 有 成 功 的 表现 (例如 , 提出 的 理论 方法 在 实际 应 用 中 获得 成 功 ， 
研究 成 果 发 表 于 高 影响 力 期 刊 )， 或 可 以 大 胆 预测 ， 作 者 提出 初始 思路 的 那 篇 文章 有 可 能 
就 是 睡 美人 文献 。 
另外 ， 本 文 又 在 van Raan 的 研究 基础 上 ， 验 证 了 睡 美人 文献 潜在 的 技术 与 应 用 属性 ， 
而 非 人 们 通常 所 认为 的 睡 美人 文献 应 该 多 为 高 深 葛 测 的 理论 性 、 基 础 性 研究 的 传统 认识 。 从 
研究 层次 (Research level) 上 看 ， 睡 美人 文献 的 研究 内 容 多 为 技术 创新 或 应 用 研究 ， 早 期 即 
被 专利 引用 。 所 以 ， 如 果 一 篇 论文 反映 的 创新 内 容 属于 变革 性 研究 ， 比 如 在 标题 或 摘要 中 明 
显 标注 类 似 术语 (如 disagree、overcome、break、dispute... 等 )， 如 果 这 样 的 研究 论文 发 表 
后 多 年 一 直 未 被 引用 或 被 引 很 少 , 但 却 发 表 之 后 立即 被 专利 引用 , 说 明 该 研究 具有 技术 转化 
潜力 , 论文 沉睡 可 能 是 因为 技术 尚未 成 熟 而 未 被 大 量 引 用 ,而 一 旦 后 期 条 件 或 技术 成 熟 ， 或 
许 能 带动 那 篇 文章 的 被 引 次 数 增长 。 所 以 ， 要 预测 睡 美人 文献 ， 首 先 要 识别 变革 性 研究 ， 然 
后 做 好 “追踪 ”， 找 到 如 下 蛛丝马迹 : 比如 作者 是 否 持续 开展 该 主题 的 研究 ， 是 否 从 理论 研究 
深化 、 拓 展 到 实践 研究 ， 实 践 中 是 否 成 功 ; 论文 发 表 之 后 是 否 有 专利 授权 ,论文 是 否 被 专利 
引用 等 ， 这 些 都 是 预测 零 被 引 或 低 被 引 论文 在 未 来 获得 高 被 引 潜力 的 重要 线索 。 
2.2 应 用 Bcp 指数 识别 正 处 于 “沉睡 -唤醒 ”萌芽 期 的 研究 
笔者 在 Ke et al.(2015) 提 出 的 美丽 指数 〈B 指数 ) 基础 上 ， 通 过 将 考察 对 象 “年 度 被 引 次 
数 ” 优 化 为 “年 度 被 引 次 数 的 累积 百分比 ”， 提 出 一 个 用 于 识别 睡 美人 文献 的 新 的 简易 无 参数 
指标 一 一 Bcp 指数 ， 并 在 此 框架 下 重新 定义 了 唤醒 时 间 、 睡 眠 时 长 和 睡眠 深度 ”。 实 证 研究 
发 现 ，Bcp 指数 对 论文 发 表 之 初 被 引 次 数 的 约束 效力 显著 高 于 B 指数 , 更 符合 睡 美人 文献 早 
期 零 被 引 和 低 被 引 的 特征 。 Bcp 指数 对 论文 总 被 引 次 数 和 年 度 被 引 次 数 最 大 值 的 依赖 程度 低 
于 B 指数 。 我 们 关注 零 被 引 或 低 被 引 现象 的 意义 在 于 发 现 低 被 引文 献 中 意义 重大 ， 即 成 为 
睡 美人 的 文献 。B 指数 对 总 被 引 次 数 的 依赖 性 高 ， 说 明 关 注 点 仍 侧重 〈 最 ) 高 被 引文 献 ， 可 
能 忽视 了 次 高 被 引文 献 中 睡 美人 的 存在 ， 自 然 也 忽视 了 剖析 其 中 的 规律 。 在 文献 计量 学 中 ， 
最 高 被 引文 献 通过 被 引 次 数 这 一 单一 指标 即 可 识别 出 来 , 不 易 被 忽视 。 而 把 被 引 次 数 相对 不 
是 最 高 、 平 时 不 易 观 察 到 , 但 却 又 具有 了 睡 美人 特征 、 有 潜在 重大 意义 的 文献 识别 出 来 ,具有 
重要 意义 。Bcp 指数 对 早期 发 表 的 睡 美 人 文献 更 敏感 ， 且 更 容易 识别 出 总 被 引 次 数 和 年 度 被 
引 次 数 较 低 的 睡 美 人 文献 。 
笔者 认为 ，Bcp 指数 可 作为 预测 睡 美 人 文献 的 另 一 思路 。 笔 者 已 通过 数学 公式 推导 出 ， 
rr 对 于 任意 一 篇 非 零 被 引 论文 , Bcp 指数 的 取 值 范围 是 [-(a-1)/2, (a-1)/2], a 为 论文 年 龄 (age); 
Bcp=0， 这 说 明年 度 被 引 次 数 相 同 。Bcp 指数 的 优势 在 于 考察 的 是 论文 年 度 被 引 次 数 累 积 
分 比 , 所 以 对 于 不 同 的 被 引 次 数 规模 的 论文 的 延迟 承认 程度 均 可 以 进行 直接 比较 。 例如 对 于 
一 篇 年 龄 为 10 年 的 论文 ，Bcp 值 约 接近 于 4.$， 则 说 明 延 迟 承认 程度 越 高 。Bcp 指数 的 优势 
就 在 于 即使 一 篇 论文 从 发 表 至 考察 期 被 引 次 数 仍 较 少 , 但 能 够 识别 出 那些 正 处 于 “沉睡 -唤醒 ” 
萌芽 期 的 论文 ， 比 如 首次 出 现 被 引 突 增 苗 头 的 论文 。 有 被 引 突 增 的 苗头 ， 则 可 能 预示 着 未 来 
这 种 增长 势头 会 继续 显现 ， 而 成 为 睡 美人 文献 。 关 于 采用 一 个 综合 模型 来 预测 睡 美人 文献 ， 
是 一 个 未 来 努力 的 方向 或 目标 。 


3 睡 美人 文献 研究 的 科技 政策 启示 

基于 上 文 分 析 , 本 部 分 从 加 强 变革 性 研究 、 识别 研究 前 沿 和 改善 学 术 评 价 三 个 方面 讨论 
分 析 挖掘 睡 美 人 文献 的 科技 政策 启示 与 建议 。 

3.1 睡 美人 文献 与 变革 性 研究 

睡 美人 文献 反映 的 创新 成 果 多 是 变革 性 研究 , 这 类 研究 若 遭 遇 延 迟 承 认 , 可 能 存在 跨 领 
域 唤醒 机 制 ， 即 在 一 个 领域 提出 的 创新 思想 可 能 在 新 的 领域 有 了 用 武之 地 。 变 革 性 研究 是 指 


挑战 或 颠覆 既 有 研究 范式 的 创新 性 研究 。 这 一 概念 主要 来 源 于 美国 国家 科学 基金 会 (NSF )， 
也 受到 了 我 国 科技 政策 制定 者 和 政策 分 析 专 家 的 密切 关注 PP。《“ 十 三 五 ”国家 科技 创新 丰 
划 》 提 出 “推进 颠覆 性 技术 创新 ， 加 速 引领 产业 变革 ”， 实 现 颠 履 性 技术 创新 离 不 开 变革 性 研 
究 ; 《国家 自然 科学 基金 “十 三 五 ”发展 规划 》 也 提 到 ， 完 善 从 非 共识 学 术 争议 中 甄别 发 现 原 
创 思想 的 工作 机 制 , 探索 加 强 对 挑战 传统 范式 的 变革 性 研究 的 资助 力度 。 但 由 于 变革 性 研究 
挑战 或 颠覆 现 有 研究 范式 ， 让 同行 专家 取得 共识 性 的 评议 意见 非常 困难 。 如 何 使 得 同行 评议 
专家 积极 发 现 和 及 时 甄别 具有 变革 性 创新 的 项 目 申请 书 ， 仍 然 面临 着 诸多 挑战 。 随 着 交叉 学 
科 的 不 断 兴 起 和 发 展 , 如 何 做 好 交叉 学 科 科 研 项 目的 评定 和 资助 工作 , 如 何 早期 识别 和 评价 
出 某 项 颠 履 性 创新 研究 的 价值 ， 都 还 需要 基金 资助 机 构 进一步 探索 创新 同行 评议 方式 。 

3.2 睡 美人 文献 与 研究 前 沿 

根据 创新 程度 , 科研 成 果 可 分 为 开创 性 成 果 与 扩展 性 成 果 。 睡 美人 文献 与 研究 前 沿 密切 
相关 。 与 热点 跟风 式 成 果 相 比 ,重大 创新 成 果 往往 遭遇 延迟 承认 ,这 是 科技 创新 的 基本 规律 。 
科学 界 有 这 样 一 种 共识 一 一 “科研 做 的 年 头 一 长 ， 我 们 就 会 渐渐 明白 ， 论 文 的 影响 和 学 术 水 
平 其 实 不 是 一 回 事 。 好 的 科研 往往 独辟蹊径 , 所 出 的 成 果 需 要 过 一 段 时 间 甚 至 很 多 年 以 后 才 
会 慢 慢 被 主流 接受 ， 在 短期 引用 率 上 反映 不 出 来 。 论 文 下 的 计算 基于 短期 (两 年 ) 引用 ， 
所 以 要 追求 论文 的 IF, 意味 着 我 们 必须 做 热点 性 、 跟 风 性 的 研究 工作 。”3 受 上 述 共 识 启发 ， 
笔者 认为 可 以 用 延迟 承认 的 思路 开展 研究 前 沿 的 识别 。 情 报 学 擅长 的 研究 热点 分 析 多 以 “ 快 
速 高 被 引 ” 的 论文 为 基础 资料 ， 而 科学 家 眼中 的 研究 前 沿 则 可 能 是 缓慢 高 被 引 、 目 前 处 于 爆 
发 前 萌芽 状态 、 引 文 曲 线 符合 睡 美人 文献 特征 〈 一 开始 被 引 很 少 ， 后 来 突然 高 被 引 ) 的 研究 
内 容 。 因 此 ， 作 为 文献 计量 学 特定 概念 的 研究 前 沿 (research front) 和 科学 家 眼中 的 研究 前 
沿 (research fontier) 不 完全 等 同 。 

高 被 引 论文 可 分 为 “最 高 被 引 论文 ?和 “次 高 被 引 论文 ”。 关 注 低 被 引 现象 的 意义 在 于 发 掘 
低 被 引 论文 中 意义 重大 的 论文 。 情 报 学 领域 擅长 做 “研究 热点 "， 但 如 何 分 析 “ 研 究 冷 门 ， 特 
别 是 要 识别 出 有 潜力 、 重 要 的 研究 冷门 ， 仍 是 一 个 挑战 。 根 据 科 学 发 展 的 自身 规律 ， 真 正好 
的 \ 创 新 性 的 研究 总 是 少数 人 开创 的 ,容易 被 忽视 或 抵制 .开始 阶段 不 可 能 纷纷 跟风 涌 入 的 。 
Becp 指数 可 用 于 挖掘 正 处 于 沉睡 -唤醒 萌芽 期 的 论文 。 利 用 Bep 指标 ， 能 够 识别 出 总 被 引 次 
数 不 是 那么 高 , 但 生命 周期 的 后 段 被 引 次 数 突 增 的 这 类 文献 ,能 够 找到 一 些 科学 界 里 面 处 在 
沉睡 -唤醒 这 个 导数 特别 大 的 区 间 的 工作 ， 进 而 推动 科学 界 及 早 关 注 这 一 类 研究 。 把 这 类 平 
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二 时 不 易 观 察 到 , 但 又 有 潜在 重大 意义 的 研究 工作 识别 出 来 ,对 于 前 瞻 部 署 科 技 前 沿 、 识 别 有 
rr 潜力 的 研究 冷门 、 乃 至 预测 诺 贝尔 奖 得 主 等 提供 了 新 的 思路 、 工 具 和 方法 。 


3.3 睡 美 人 文献 与 学 术 评价 

当前 政府 和 科技 界 正 在 倡导 建立 以 科技 创新 质量 、 贡 献 、 绩 效 为 导向 的 分 类 评价 体系 。 
科技 评价 应 侧重 强调 研究 的 质量 和 贡 献 。 一 篇 论文 的 影响 力 取 决 于 其 所 在 的 学 科 规 模 、 论文 
主题 的 研究 热度 、 理 论 页 献 、 作 者 声誉 、 期 刊 影响 力 等 诸多 因素 ,而 一 篇 论文 的 质量 主要 取 
决 于 理论 贡献 。 以 往 研 究 和 本 研究 均 表明 ， 高 质量 论文 不 一 定 高 被 引 ， 高 品质 、 重 大 原创 性 
论文 往往 会 有 一 个 “沉睡 期 *， 会 遭遇 延迟 承认 ,在 被 引 次 数 上 表现 出 睡 美人 文献 的 特征 。 因 
此 ， 本 文 所 提出 的 Bcp 指数 可 作为 评价 论文 学 术 质 量 一 个 参考 指标 。 

科技 论文 发 表 之 后 要 经 受 形式 评价 、 内 容 评价 和 历史 评价 。 第 一 种 评价 依据 刊物 影响 因 
子 、 领 域 排序 、 论 文 引 用 等 指标 ; 第 二 种 依据 同行 对 研究 者 所 报告 信息 的 分 析 比 较 ; 第 三 种 
则 依据 经 受 了 时 间 检 验 的 科学 贡献 站。 鉴于 重大 科技 创新 成 果 与 学 术 热 点 跟风 式 成 果 相 比 
往往 遭遇 延迟 承认 , 目前 学 术 评价 实践 中 大 都 将 “ 近 5 年 代表 性 论文 及 其 被 引 次 数 " 作 为 一 个 
必要 指标 ， 建 议 遵循 科技 创新 的 基本 规律 ， 探 索 建立 长 效 评价 机 制 ， 适 度 延 长 评价 周期 。 
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